A indústria musical global movimenta bilhões anualmente; compreender os fatores de popularidade é estratégico
Desafio Científico
Problema multidimensional de regressão com características acústicas complexas e não-lineares
Contribuição Acadêmica
Aplicação rigorosa da metodologia CRISP-DM com validação estatística completa
Aplicabilidade Prática
Sistema implementado e validado, pronto para implantação em ambiente de produção
Objetivo Geral: Desenvolver um modelo preditivo robusto que demonstre a relação entre características acústicas objetivas e popularidade musical, contribuindo para a literatura em Music Information Retrieval (MIR)
Problema de Pesquisa
"Quais características acústicas objetivas apresentam maior poder preditivo sobre a popularidade de músicas na plataforma Spotify, e qual o desempenho de diferentes algoritmos de machine learning nesta tarefa?"
113.999
Instâncias Analisadas (músicas)
23
Atributos Totais no Dataset
9
Features Acústicas Principais
0-100
Escala da Variável Target (Popularidade)
Stakeholders e Aplicabilidade
Artistas e Produtores
Otimização de decisões criativas baseada em evidências empíricas
Gravadoras e Editoras
Suporte à decisão para investimentos em catálogos musicais
Plataformas de Streaming
Aprimoramento de sistemas de curadoria e recomendação algorítmica
Profissionais de Marketing
Desenvolvimento de estratégias promocionais data-driven
Fundamentação Metodológica: CRISP-DM
Business Understanding: Definição clara do problema de pesquisa e estabelecimento de KPIs
Data Understanding: Análise Exploratória de Dados (EDA) completa com visualizações estatísticas
Data Preparation: Pipeline de pré-processamento, normalização e feature engineering
Modeling: Treinamento e validação de 6 algoritmos distintos de ML
Evaluation: Avaliação rigorosa com métricas padrão (MAE, RMSE, R²) e validação cruzada
Deployment: Implementação de API REST, dashboard interativo e containerização
Materiais: Caracterização do Dataset
Dataset Spotify Songs: 113.999 Instâncias
23
Atributos Totais (Features + Metadados)
9
Features Acústicas para Modelagem
100%
Completude dos Dados (sem valores ausentes)
0-100
Domínio da Variável Target
Fonte: Spotify Web API |
Período de Coleta: Dataset histórico acumulativo |
Tipo de Dados: Estruturados e normalizados
Arquitetura do Sistema
FastAPI REST APIStreamlit DashboardPython Library
Stack Tecnológico
Python 3.8+
scikit-learn
XGBoost
FastAPI
Streamlit
Docker
GitHub Actions
Pytest
Pipeline de Processamento
📊 Dados Brutos (113.999 músicas)
↓
🔍 Análise Exploratória
├─ Distribuições de features
├─ Correlações
└─ Detecção de outliers
↓
🧹 Limpeza e Preparação
├─ Tratamento de missing values
├─ Normalização (StandardScaler)
└─ Feature engineering
↓
🤖 Modelagem
├─ Train/Test Split (80/20)
├─ 6 Modelos diferentes
└─ Hyperparameter tuning
↓
📈 Avaliação
├─ Métricas: MAE, RMSE, R²
├─ Validação cruzada
└─ Feature importance
↓
🚀 Deployment
├─ Serialização do modelo
├─ API REST (FastAPI)
└─ Dashboard (Streamlit)
Variáveis Preditoras: Características Acústicas
Feature
Definição Operacional
Domínio/Escala
Danceability
Adequação para dança baseada em elementos como tempo, estabilidade rítmica, força da batida e regularidade
0.0 - 1.0 (contínua)
Energy
Medida perceptual de intensidade e atividade, correlacionada com loudness, timbre e densidade espectral
0.0 - 1.0 (contínua)
Loudness
Volume médio da faixa em decibéis, calculado sobre toda a duração
-60 a 0 dB (contínua)
Valence
Positividade musical transmitida, de triste/depressiva a alegre/eufórica
0.0 - 1.0 (contínua)
Acousticness
Probabilidade estimada de a faixa ser acústica (confiança de 0-100%)
0.0 - 1.0 (contínua)
Tempo
Andamento estimado em batidas por minuto (BPM)
0 - 250+ BPM (contínua)
EDA: Distribuição da Variável Target
Medida de Tendência Central: Média ≈ 38 pontos (mediana próxima)
Acousticness (8.9%) - Músicas menos acústicas (eletrônicas) tendem a ser mais populares
As 3 principais features explicam ~64% da importância total do modelo
Comparação Visual de Modelos
XGBoost apresenta os melhores resultados:
Menor erro (MAE = 12.48) e maior variância explicada (R² = 0.254)
Principais Resultados
25%
Variância Explicada (R²)
±12.5
Erro Médio (MAE)
Discussão: Principais Achados da Pesquisa
Poder Preditivo Moderado: Características acústicas explicam aproximadamente 25% da variância da popularidade (R²=0.254), indicando que fatores externos são predominantes
Dominância de Atributos de Intensidade: Loudness e Energy são os preditores mais relevantes, sugerindo preferência por músicas energéticas e com maior volume
Não-Linearidade das Relações: Superioridade de modelos ensemble baseados em árvores sobre modelos lineares indica interações complexas entre features
Fatores Não-Capturados: Aproximadamente 75% da variância não explicada sugere forte influência de marketing, reputação do artista, contexto temporal e viralização social
Segmentação Natural: Análise de clustering revelou 4 perfis distintos de músicas, indicando heterogeneidade no dataset
Limitação Metodológica: Características acústicas isoladas são insuficientes para predição completa; modelos multifatoriais são necessários
README.md: Guia completo com badges, arquitetura, exemplos
QUICKSTART.md: Instalação em 5 minutos
CONTRIBUTING.md: Guia para contribuidores
SECURITY.md: Política de segurança
API Docs: OpenAPI/Swagger interativo
Docstrings: Google-style em todo código
Relatório Técnico: Análise detalhada (PT-BR)
Competências Demonstradas
EDA
Visualização
ML Supervisionado
Clustering
Recomendação
APIs RESTful
Dashboards
DevOps
Recomendações para Trabalhos Futuros
Modelagem Temporal: Incorporação de séries temporais e análise de tendências longitudinais para capturar evolução da popularidade
Variáveis Contextuais: Inclusão de features relacionadas ao artista (follower count, histórico de lançamentos), métricas de engajamento social e dados de marketing
Processamento de Linguagem Natural: Análise de sentimento e extração de tópicos a partir das letras musicais
Deep Learning Multimodal: Exploração de redes neurais profundas, transfer learning e análise de áudio raw (spectrogramas, MFCCs)
Deployment em Nuvem: Implementação escalável em plataformas cloud (AWS/GCP/Azure) com auto-scaling e load balancing
MLOps Avançado: Integração com MLflow para tracking de experimentos, monitoramento de drift de dados e retreinamento automático
Validação Cross-Cultural: Análise comparativa entre diferentes mercados geográficos e culturas musicais
Causalidade: Aplicação de métodos de inferência causal (Propensity Score Matching, Instrumental Variables) para estabelecer relações causais
Limitações Metodológicas e do Estudo
Multifatorialidade Não-Capturada: Popularidade é influenciada por fatores contextuais externos não representados no dataset (esforços de marketing, viralização em redes sociais, momento de lançamento, eventos culturais)
Temporalidade e Viés de Seleção: Dataset representa snapshot temporal específico; popularidade é dinâmica e evolui temporalmente
Viés de Plataforma: Dados específicos do Spotify podem não generalizar para outras plataformas de streaming ou mercados geográficos distintos
Causalidade vs. Correlação: Análise observacional não estabelece relações causais; correlações identificadas podem ser espúrias ou mediadas por variáveis confundidoras
Variância Não-Explicada: R² de 0.254 evidencia que 75% da variância permanece não explicada por features acústicas, reforçando necessidade de modelos multifatoriais
Ausência de Validação Temporal: Não foi realizada validação em janela temporal futura (walk-forward validation)
Conclusões e Contribuições
✅ Técnico-Científico
Sistema completo implementado seguindo padrões de engenharia de software e boas práticas em MLOps
✅ Metodológico
Aplicação rigorosa da metodologia CRISP-DM com validação estatística apropriada
✅ Prático-Aplicado
Insights acionáveis derivados de análise empírica para stakeholders da indústria musical
✅ Acadêmico
Pesquisa documentada, reprodutível e com código aberto para validação pela comunidade científica
Conclusão Principal: Técnicas de Machine Learning podem auxiliar na compreensão de padrões de popularidade musical baseados em características acústicas, mas devem ser complementadas com análise de fatores contextuais e socioculturais para aplicações práticas efetivas
Referências
GERON, A. Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow. 3rd ed. O'Reilly Media, 2022.
CHEN, T.; GUESTRIN, C. XGBoost: A Scalable Tree Boosting System. Proceedings of the 22nd ACM SIGKDD, 2016.
SPOTIFY. Web API Documentation. Disponível em: https://developer.spotify.com/documentation/web-api/
PEDREGOSA, F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, v. 12, p. 2825-2830, 2011.
LESKOVEC, J.; RAJARAMAN, A.; ULLMAN, J. Mining of Massive Datasets. 3rd ed. Cambridge University Press, 2020.